
# “通过时间反向传播”仅仅适用于反向传播在具有隐状态的序列模型
# 为了计算的效率，“通过时间反向传播”在计算期间会缓存中间值
